公然造假却被央视吹爆!AI产品毁三观凭啥值千亿?

2024年最能搞事的巨头，依然是OpenAI。

先是创始人兼CEO奥特曼，透露预计筹集7万亿美元，用来提高全球芯片制造能力。

7万亿美元，都能把苹果、微软、谷歌一起打包买走了。

相比天文数字，更让人震惊的是OpenAI的另一件事。

2月16日凌晨，它的首个文生视频模型Sora正式亮相，并发布了几段AI生成的视频，最长60秒。

AI视频，从此达到了以假乱真的程度。

看到这些视频，普通人直呼“现实，不存在了”，同行们则全萎了。

明星AI公司Stability AI，原本也发布了一个新的视频模型，但看到Sora的视频后，官方火速删除了自家推文。

另外一家公司Runway，创始人感慨：过去要干一年的活，现在被它几天、几小时就干完了。

马斯克则到处留言“人类愿赌服输（gg humans）”。

央视也被惊动，有多个频道都对Sora进行了全天候报道。

对于Sora，目前全程高兴的只有两种人。

一个是老色批，他们已经快进到“MR头显+AI创作剧情”的联想了。

一个自然是OpenAI，再次逼疯同行后，其估值达到800亿美元，还可能飙升。

只能生成60秒视频的Sora，凭啥这么值钱？

发布2个小时，让对手损失上亿

在AI生成视频的领域，OpenAI不是第一个吃螃蟹的。

不一样的是，之前的AI视频公司，它们做的AI生成视频，基本只有几秒，而且模糊不清，还有明显的违和感。

比如去年，AI生成的一个外国男明星吃意大利面的视频，一眼假。

所以不少大佬都说在AI生成视频方面，我们还有很长的路要走。

但它的商业价值，没能人否认。

此前业内最知名的Runway，最多只能生成18秒的视频，但凭这手功夫，Runway参与了奥斯卡获奖影片《瞬息全宇宙》的制作，估值一度达到15亿美元。

还有一家去年底成立的创业公司Pika，靠其文生视频大模型轰动一时。这家只有4个人的公司，半年时间完成了三轮融资，估值飙升到2.5亿美元。

只是没想到，横空出世的Sora，一夜搅没了所有人的美梦。

Runway的CEO第一时间在网上说了两个字：“Game On(竞争开始了).”

另一家AI视频公司Stability的CEO甘拜下风：“奥特曼真是个魔术师。”

美国图片供应商Shutterstock，被跨界打击，在Sora发布的2小时，其市值损失了约7000万美元。

更惨的是谷歌，秒变科技界的汪峰。

因为就在Sora发布的同一天，谷歌也重磅发布了新一代多模态大模型Gemini 1.5 Pro，在性能上完全秒杀OpenAI的GPT-4 Turbo。

这本该是谷歌扬眉吐气的一天，却被Sora抢走了所有头条。

能让所有公司黯然失色，Sora太颠覆了。

别人还在用AI费劲地生成4秒动图，Sora随意生成60秒的高清大片。

其他AI生成视频充满山寨感，Sora甚至能生成电影级别的场景，以假乱真。

连“同一场景”下的多机位视频，Sora都整出来了。

无论是视频时长、画面精细度，还是细节完整性，不论是一镜到底还是多机位无缝切换，Sora的表现都可以用碾压对手来形容。

有人用相同的提示词，对比Sora和其他同类产品生成的视频，差距一目了然。

更关键的是，使用Sora的门槛极低。

从官方发布的宣传视频看，你只需要输入“构成元素、环境、行为及发生顺序、视频风格”等提示词，就能生成不同风格的高清、连贯、具有丰富运镜和转场的60秒视频。

所以，用它生成其他风格的虚拟视频也很容易，比如3D或动漫风。

同时还能根据要求，直接生成不同尺寸的视频，适配不同设备的屏幕。

说不定很快，人人都能有个导演梦。

Sora价值千亿的底气，不是秘密

其实Sora还有很多明显的弱点。

OpenAI指出，它可能难以准确模拟复杂场景的物理原理，并且可能无法理解因果关系。

比如这个视频里，老人吹蜡烛前后，火苗没有丝毫变化，不合常理。

酒杯摔碎，但是液体的流动和玻璃的破裂关系，也不合理。

一个人在跑步机上倒着跑步，更不合理。

对于AI来说，现实世界里再简单、再自然的现象，它可能都需要学习才能理解和还原。

去年很火的“AI绘画”，一开始也有类似毛病。

让它画一幅“在地上睡”的图，呈现出的可能是“地板+枕头+人头”，以为把脑袋放在枕头上就是睡觉。

还有人发现，AI绘画总是不能让人物老老实实地吃拉面。用什么工具吃面，一口吃几根，AI都需要学习。

但AI绘画技术很快迭代，不再智障，反而成了工作利器。

一名做插画设计相关工作的人表示，用了AI绘画后，工作更高效了，“现在甲方给我一个主题，我可以同时给他生成七八张图。”

现在还有明显硬伤的Sora，也有快速迭代的能力。

这主要得益于它理解长文的能力，这也是OpenAI本来就有的杀手锏。

比如在输入端，OpenAI利用GPT，先将用户输入的提示词进行精准的详尽扩写，然后再将扩写后的提示词交给Sora，让Sora能更好地遵循提示词来生成精准的视频。

所以相比以往的AI视频生成，只能死板地翻译文案，接着生成死板的视频，Sora不光能理解文案，还能基于文案自行发挥，让视频变得更自然、更精彩。

就好像这个视频，在完成主题的前提下，Sora又自动进行了多次镜头转换。

有了更好的理解能力，才能有更好的逻辑能力。

因此，在理解和掌握了更多现实世界的现象以及规律后，Sora生成的视频会越来越接近真实。

行驶中的列车窗外偶遇遮挡，车内人物倒影的短暂出现，十分惊艳。

也可以来一段好莱坞大片质感的电影预告片。

近景视角下，镜头细节拉满。

这也是为什么，OpenAI把Sora定义为“世界模拟器”。

除了接近真实，Sora还能实现人类的非现实脑洞。举个例子，根据提示词“一个杯子里两艘海盗船战斗的逼真近距离视频”，它生成了这样的视频。

难怪很多网友直呼要失业了，影视、广告、游戏等很多行业都会被冲击。

不少人还认为，连抖音、TikTok等短视频平台也要有危机感了。

毕竟AI生成视频一旦踏入正轨，输出源源不断，再加上AI还能更好地理解人类的成瘾机制，如果OpenAI推出自己的短视频平台，很可能成为一方霸主。

OpenAI可能存在的野心，越来越吓人了。

从巨亏到狂赚，它为何成了巨头的噩梦？

作为近两年的科技界顶流，有段时间，OpenAI并不被看好。

在其创立的前几年，OpenAI毫无盈利能力，全靠金主爸爸养活。

以至于曾有商业报告称，OpenAI仅运行其人工智能服务ChatGPT每天就要花费约70万美元，OpenAI目前正处于烧钱的状态，若不加速自身商业化进程，很有可能在2024年底不得不申请破产。

但OpenAI用行动表示：不是不会赚钱，只是还不想赚钱。

去年下半年开始，OpenAI加速商业化。创始人介绍，截至去年11月，有92%的财富500强公司在使用OpenAI的产品。整个2023年，OpenAI的收入突破了20亿美元。

与此同时，其最著名的产品ChatGPT，周用户量达到了1亿。

随之而来的是它水涨船高的估值，从去年年初的300亿美元暴涨到如今的800亿美元，在创业公司里仅次于字节跳动和SpaceX。

不过，比起赚钱能力和飙升的估值，OpenAI身上还有更让巨头忌惮的特质。

那就是开创风口的能力。

过去14个月，OpenAI始终是风口中的顶流。

从AI聊天，到AI绘画，再到AI生成视频，OpenAI的每次亮相似乎都在打脸巨头。

ChatGPT刚一亮相，吓得谷歌紧急推出AI加持的搜索引擎Bard，结果出师不利，当天股价大跌7.4%，市值蒸发1024亿美元。

Sora只是发出几段AI视频，抢走了所有科技版头条，让已经耕耘良久的同行自惭形秽。周鸿祎还在微博发长文表示，Sora意味着AGI实现将从10年缩短到1年。

如今火热的生成式AI市场，可以说离不开OpenAI的一步步推波助澜。

一个创业公司，抢先开创风口、放大市场，隐隐有成为新巨头的迹象，足以成为当下所有巨头的噩梦。

但与其眼红OpenAI不断开创风口，巨头们更该做的是反思。

前搜狗CEO王小川曾评论说：“OpenAI的成功，首先是技术理想主义的胜利。中国需要自己的OpenAI，就需要技术理想主义。大厂受自己的业务牵引，追逐资本热点的创业公司更动作变形。”

其实不论国内外，这个问题都存在。

在发展中，技术和创新的重要性不知不觉退居到了第二位，一切动作变成了为收入服务。

OpenAI就像曾经的影子，提醒它们必须想起久违的拼劲。

从ChatGPT到Sora，在AI的冲击面前，许多行业里的普通人都开始有危机感，巨头也别妄想能继续躺平。

推荐阅读

才豁免又征新税?川普:最早周五对加拿大征对等关税

美国拟对中国制造、注册船只收取泊港费

精简计划步步推进!一场革命袭来,越南铁饭碗不保(组图)